10. DQN 改进
DQN 改进
阅读延伸
- Thrun 和 Schwartz,1993 年, 《使用函数逼近进行强化学习存在的问题》 ( 高估 Q 值)
- van Hasselt et al.,2015 年, 《双 Q 学习的深度强化学习》
- Schaul et al.,2016 年, 《优先经验回放》
- Wang et al.,2015 年。 《深度强化学习的对抗网络架构》 。
- Hausknecht 和 Stone,2015 年, 《部分可观察 MDP 的深度递归 Q 学习》
DQN 改进
阅读延伸